基于引文信息的协同过滤算法研究

基于引文信息的协同过滤算法研究

作者:师大云端图书馆 时间:2020-01-20 分类:参考文献 喜欢:1777
师大云端图书馆

【摘要】随着移动互联网的广泛应用以及大数据的飞速发展,因数量增长而导致的信息过载的问题表现的越来越明显,并且影响严重。信息海量增加与人们接纳信息能力的有限性之间日益增长的矛盾,致使无法合理有效的使用许多信息资源。在科学研究领域,特别是随着大量的论文信息呈现指数级别增长,想要在互联网上查找到一篇自己想要的文献,经常因为查到大量而且不符合自己需求的信息资源而无功而返。科学研究工作者如何解决文献资源使用的问题,已成为科学研究领域的一大难题。学者以及科学研究工作者的辛勤劳动的智慧结晶是以文献的形式表述出来,所以科学文献是作者研究方向和研究成果的最直接和基本体现。在科学创新活动中文献起着重要作用,快速、准确地获取所需求的文献信息对于科学工作者而言直接影响到科学研究、教学工作的效率与成功。科学文献信息资源的占有、配置、开发、使用的程度与速度,对科学研究的发展而言是影响国家和地区科学技术能力强弱、科研水平高低的重要因素。论文首先综述了引文信息和推荐系统的研究状况,分析并且总结目前现有引文信息研究的成果和局限,同时总结协同过滤推荐算法的长处和缺点。同时,本文还介绍了科学引文数据中的相似度计算方法,分析和总结了他们的原理以及使用领域。在仔细分析相关的论文的基础上,针对当前的协同过滤技术在科学引文数据上面临的问题,深入研究科学引文数据和协同过滤算法结合起来的方法,并给出一些有效的解决算法。本文的内容包括以下几个方面:首先,针对用户在科学引文数据上的引用关系信息,本文中先对科学引文数据的建立矩阵,然后提出一种使用模糊矩阵聚类相似度计算的方法。该方法使用引文自身的信息,建立模糊数据矩阵,进行模糊聚类。由模糊矩阵计算出相似度后,提出一种根据相似度信息和论文评分信息预测用户评分的算法,论文中称该算法预测出的论文评分为论文信任评分。其次,由于传统的协同过滤推荐算法具有时间空间性能比较大、给新用户进行推荐困难等局限性,特别是在针对在大规模用户的推荐系统时。文章提出了一种基于用户特征-论文矩阵的协同过滤推荐算法,构建“论文特征-项目”的评分矩阵,继而利用奇异矩阵分解方法求解矩阵,最后根据求解后的矩阵和论文的特征信息,使用线性加权的方式预测用户对项目的评分,本文中称该算法预测出的用户评分为用户偏好评分。论文最后,需要有一种算法针对引文的信任评分和引文偏好评分进行融合,以便于形成最终需要推荐给用户的评分。本文提出了一种使用机器学习融合论文信任评分和论文偏好评分的算法,该算法使用论文信任评分、论文偏好评分、用户科学引文数据上合作者数量、论文特征数量等作为求解,以及论文实际的引用评分为标注信息。继而通过使用费希尔线性回归的方法来预测用户对论文的评分,最终的用户对论文的评分即由算法求解所得。
【作者】丁彬钊;
【导师】黄岚;
【作者基本信息】吉林大学,计算机应用技术,2014,硕士
【关键词】协同过滤;引文信息;模糊聚类;推荐系统;引文特征;

【参考文献】
[1]唐超,孙昕.TETRA协议分析仪协议栈处理软件的开发[J].移动通信,2014,20:63-67.
[2]周光宁.恶性肿瘤相关性高凝状态与急性缺血性脑卒中关系的临床研究[D].福建医科大学,神经病学,2014,硕士.
[3]王雅雯,莫尊理,郭瑞斌,袁恩辉,胡惹惹,魏晓娇.碳纳米材料/树状大分子复合材料研究进展[J].功能材料,2014,13:13001-13005.
[4]王万珍.关于风景园林中水环境设计的探索[J].政府法制.2007(05)
[5]张伟.长螺旋搅喷技术应用研究[D].中国地质大学(北京),地质工程,2013,硕士.
[6]屈超.知识经济测度方法研究[D].东北财经大学,统计学,2003,硕士.
[7]李峰.IPv6下协议分析技术在入侵检测系统中的研究与应用[D].太原理工大学,计算机应用技术,2004,硕士.
[8]赵冰青.装载机用湿式多盘制动器摩擦盘温度场和应力场的分析[D].郑州大学,机械制造及其自动化,2013,硕士.
[9]支枫.microRNA在星形细胞瘤/脑膜瘤中的表达及功能研究[D].南京大学,2013.
[10]程星亮.基于六角形晶格的光子晶体零折射率特性及其光学应用研究[D].兰州大学,无线电物理,2013,硕士.
[11]张昆.塔里木盆地JY地区火成岩地震相与地震反演的应用研究[D].中国矿业大学,固体地球物理学,2014,硕士.
[12]武文.基于农林复合生态系统的血吸虫疫区景观整治规划研究[D].中南林业科技大学,园林植物与观赏园艺,2014,硕士.
[13]谢洪明,罗惠玲,王成,李新春.学习、创新与核心能力:机制和路径[J].经济研究,2007,02:59-70.
[14]徐琼霞.新中国幼儿园课程改革的理性反思[D].湖南师范大学,课程与教学论,2004,硕士.
[15]夏明帅.试论陆龟蒙之隐逸及其隐名之由来[D].上海大学,中国古代文学,2013,硕士.
[16]郑路逸.基于展会收入的英、德展会股权收购模式对比[D].上海交通大学,工商管理,2013,硕士.
[17]李琼.数据仓库与数据挖掘在水利信息化中的应用[D].东北财经大学,2005.
[18]张芳芳.我国银行实施客户关系管理的探讨[D].清华大学,2004.
[19]胡文娟.基于Open CASCADE的MID激光直接成型CAM系统开发研究[D].厦门大学,机械工程,2014,硕士.
[20]梁淑淙.长航集团资本运营管理体系研究[D].武汉理工大学,工商管理,2003,硕士.
[21]李光.非法经营罪的口袋化困境和规范解释路径[D].中国社会科学院研究生院,刑法(专业学位),2014,硕士.
[22]张明君.基于位图的自动矢量化技术研究[D].西安电子科技大学,计算机系统结构,2004,硕士.
[23]姜先凯.DNA分子与纳米材料相互作用的理论研究[D].中国科学院研究生院(上海应用物理研究所),2014.
[24]高华.AGR2对结肠癌生物学行为影响的临床与实验研究[D].新疆医科大学,外科学,2013,博士.
[25]王磊.黄土沟谷地区桥梁桩基加固技术的应用研究[D].长安大学,桥梁与隧道工程,2014,硕士.
[26]杨桥樱.亚砷酸钠诱导人永生化角质形成细胞株HaCaT恶性转化及肿瘤干细胞标志物的表达及意义[D].广西医科大学,营养与食品卫生学,2013,硕士.
[27]景晓东.直接转矩控制方法研究[D].西安科技大学,控制理论与控制工程,2013,硕士.
[28]张磊.四氢糠醇催化氨化合成吡啶的研究[D].天津大学,化学工程,2013,硕士.
[29]孟庆辉.机采井免清蜡技术研究[D].东北石油大学,石油与天然气工程(专业学位),2013,硕士.
[30]逮惠娟.十九世纪九十年代顺直灾荒与荒政[D].河北师范大学,中国近现代史,2004,硕士.
[31]王植.试论基层法官的职业困境[D].内蒙古大学,法律,2013,硕士.
[32]苗冠军.我国案外第三人权利救济制度研究[D].河北大学,法律,2014,硕士.
[33]代珂.关键员工管理方案探讨[D].西南交通大学,2002.
[34]王冰.基于GPON系统的ONU及GTC层接口的设计[D].东北大学,电子与通信工程,2011,硕士.
[35]黄志强.多项式——PCG并行算法研究[D].广东工业大学,软件工程,2004,硕士.
[36]张彩莲.氨茶碱对大鼠气道平滑肌细胞增殖抑制和促凋亡作用及其机制的实验研究[D].第四军医大学,内科学,2004,硕士.
[37]刘二菊.基于GM-Markov模型的国际黄金价格预测研究[D].兰州商学院,统计学,2014,硕士.
[38]程绳.分布式电源接入配电网渗透率及运行协调优化研究[D].中国电力科学研究院,电力系统及其自动化,2014,硕士.
[39]梁春飞.基于BMPs的湖南烈士公园雨水管理研究[D].中南林业科技大学,园林植物与观赏园艺,2013,硕士.
[40]吕瑞珍.不同耕作方式对冬小麦土壤肥力特性及产量的影响[D].河南科技大学,作物栽培学与耕作学,2014,硕士.
[41]赵雪.2型糖尿病女性患者血瘀型大血管病变的临床研究[D].辽宁中医药大学,中西医结合临床(专业学位),2012,硕士.
[42]范小渝.王宠惠宪政思想探析[D].西南政法大学,法律史,2012,硕士.
[43]冯雨周.MEMS器件建模与仿真优化设计研究[D].杭州电子科技大学,机械工程,2014,硕士.
[44]张明石,马军.蒸发式冷却器[J].石油化工设备.1989(04)
[45]周燕,高一虹,臧青.大学高年级阶段英语学习动机的发展——对五所高校学生的跟踪调研[J].外语教学与研究,2011,02:251-260+320-321.
[46]孙昭荣.TechEd2002异彩纷呈[N].中国计算机报,2002-09-16D04.
[47]宁津生,李德仁,祝国瑞,张正禄,翟国君,姜卫平.中国测绘科技进展综述(2001年)[A].中国测绘学会科技信息网分会.地理空间信息技术与应用——中国科协2002年学术年会测绘论文集[C].中国测绘学会科技信息网分会:,2002:7.
[48]刘新厂.轨道检测中的惯性及视觉传感融合技术研究[D].上海工程技术大学,车辆工程,2014,硕士.
[49]杨欣坤.松辽平原玉米带主要土壤的水分特征研究[D].吉林农业大学,植物营养学,2014,硕士.
[50]孙建涛.基于甲病毒复制子的犬瘟热核酸疫苗的构建及表达特性研究[D].天津农学院,预防兽医学,2013,硕士.

相关推荐
更多